Box Plots এবং Violin Plots হলো দুইটি শক্তিশালী ভিজুয়ালাইজেশন টুল যা ডেটার ডিসট্রিবিউশন এবং বিচ্যুতি (variability) সম্পর্কে ধারণা দেয়। এগুলি সাধারণত পরিমাণগত ডেটা বিশ্লেষণের জন্য ব্যবহৃত হয় এবং ডেটার বিভিন্ন পরিসরের (range), মধ্যম (median), এবং আউটলিয়ার্স (outliers) সম্পর্কিত গুরুত্বপূর্ণ তথ্য তুলে ধরে।
Box Plot
Box Plot (বা Box-and-Whisker Plot) একটি গ্রাফিক্যাল রিপ্রেজেন্টেশন যা ডেটার বিতরণ এবং আউটলিয়ার্স দেখাতে ব্যবহৃত হয়। এটি মূলত পাঁচটি পরিসংখ্যানিক উপাদান প্রদর্শন করে:
- Minimum (নূন্যতম মান)
- First Quartile (Q1): ২৫% এর নিচে ডেটা থাকে
- Median (Q2): ডেটার মধ্যবর্তী মান
- Third Quartile (Q3): ৭৫% এর নিচে ডেটা থাকে
- Maximum (সর্বোচ্চ মান)
এছাড়া, Whiskers এবং Outliers (ডেটার অস্বাভাবিক মান) দ্বারা ডেটার বিস্তার এবং অস্বাভাবিক ডেটা প্রদর্শিত হয়।
Box Plot তৈরি করার পদক্ষেপ:
- Data Source সিলেক্ট করুন এবং Tableau তে লোড করুন।
- Rows শেলফে পরিমাণগত ফিল্ড (যেমন Sales, Profit) ড্র্যাগ করুন।
- Columns শেলফে ক্যাটেগোরিকাল ফিল্ড (যেমন Region, Product) ড্র্যাগ করুন।
- Marks কার্ডে, Box Plot নির্বাচন করুন।
ব্যবহার:
- ডেটার বিতরণ বিশ্লেষণ করার জন্য।
- আউটলিয়ার্স চিহ্নিত করার জন্য।
- গ্রুপের মধ্যে পরিমাণগত ভেরিয়েবলের তুলনা করতে।
Violin Plot
Violin Plot একটি উন্নত ধরনের গ্রাফ যা Box Plot এর মতো কিন্তু এতে Density Plot (ঘনত্ব গ্রাফ) যুক্ত থাকে। এটি ডেটার বিস্তার এবং ঘনত্বের সম্পর্ক প্রদর্শন করে, যা Box Plot থেকে অনেক বেশি বিস্তারিত ভিউ প্রদান করে। Violin Plot এ ডেটার ঘনত্ব দেখানো হয়, যার মাধ্যমে বুঝতে পারা যায় কোন অংশে ডেটা সবচেয়ে বেশি ঘনীভূত (concentrated) এবং কোথায় কম।
Violin Plot এর বৈশিষ্ট্য:
- Density Curve: Violin Plot এ ডেটার ঘনত্বের একটি সোজা রেখা প্রদর্শিত হয়, যা ডেটার প্যাটার্ন এবং ঘনত্ব দেখায়।
- Box Plot Elements: এটি Box Plot এর পাঁচটি পরিসংখ্যানিক উপাদানও দেখায়, যেমন Median, Q1, Q3, Whiskers, এবং Outliers।
Violin Plot তৈরি করার পদক্ষেপ:
- Data Source সিলেক্ট করুন এবং Tableau তে লোড করুন।
- Rows শেলফে পরিমাণগত ফিল্ড (যেমন Sales, Profit) ড্র্যাগ করুন।
- Columns শেলফে ক্যাটেগোরিকাল ফিল্ড (যেমন Region, Product) ড্র্যাগ করুন।
- Marks কার্ডে, Violin Plot নির্বাচন করুন।
ব্যবহার:
- ডেটার ঘনত্ব এবং বিস্তার দেখানোর জন্য।
- ডেটার ব্যাপকতা বিশ্লেষণ এবং তুলনা করার জন্য।
- ডেটার বিস্তার এবং ঘনত্বের মাধ্যমে গ্রুপের মধ্যে পার্থক্য দেখানোর জন্য।
Box Plot এবং Violin Plot এর মধ্যে পার্থক্য
| বৈশিষ্ট্য | Box Plot | Violin Plot |
|---|---|---|
| ডেটার প্রদর্শন | ডেটার পাঁচটি পরিসংখ্যানিক উপাদান (Minimum, Q1, Median, Q3, Maximum) দেখায়। | Box Plot এর উপাদানগুলি দেখানোর পাশাপাশি ডেটার ঘনত্বও প্রদর্শন করে। |
| ঘনত্ব গ্রাফ | নেই | ডেটার ঘনত্ব বা Density curve থাকে। |
| ব্যবহার | ডেটার বিতরণ ও আউটলিয়ার্স চিহ্নিত করতে ব্যবহৃত হয়। | ডেটার বিস্তার এবং ঘনত্বের সাথে তুলনা করতে ব্যবহৃত হয়। |
| ভিজ্যুয়াল | তুলনামূলকভাবে সরল, কেবল Box এবং Whiskers দেখায়। | Violin Plot এ Box Plot এর মতো উপাদান ছাড়াও ঘনত্বের ভিজ্যুয়াল থাকে। |
সারাংশ
Box Plot এবং Violin Plot উভয়ই ডেটার বিতরণ এবং পার্থক্য বিশ্লেষণের জন্য ব্যবহৃত হয়, তবে Violin Plot ডেটার ঘনত্বও প্রদর্শন করে, যা Box Plot থেকে আরও বিস্তারিত তথ্য প্রদান করে। যখন আপনি ডেটার ঘনত্ব এবং বিস্তার সম্পর্কে আরও গভীরভাবে জানতে চান, তখন Violin Plot ব্যবহার করা ভালো, আর যদি ডেটার মূল পরিসংখ্যানিক উপাদান এবং আউটলিয়ার্স দেখতে চান, তবে Box Plot উপযুক্ত।
Read more